Алгоритмите, които ни вкараха в „балона“

дек. 10, 2021 | Технологии

Алгоритмите, които ни вкараха в „балона“

10 декември 2021 | Технологии

Искам вечерта да гледам филм, обаче да не е тъп като последния. Търся препоръки. Някога щях да се ровя и ровя из интернет, сега няма нужда, изкуственият интелект се грижи за мен.

Алгоритмите за препоръчване на съдържание са сред по-старите и най-успешните представители на машинното самообучение. Днес да се говори за тях не е чак толкова на мода поради две основни причини. Вече могат да работят много добре и второ – никак не са удобна тема за тези, които ги използват най-активно.

Защо ли? Точно те са в основата на един от големите проблеми на днешното време: балона на филтрите. Бързаме, имаме време да четем само препоръчана информация, заобикаляме се с удобни гледни точни, нямаме сили за нюансите, така скоро се разделяме на ваксъри и антиваксъри…

…ама нали в началото ставаше дума за филми, това не е ли нещо безобидно? Точно така. Алгоритмите не са виновни за това как ние ги използваме. А историята на тези, които търсят как да предложат най-доброто съдържание, е интересна за всеки, който се интересува от технологиите и бъдещето, което те ни подготвят.

 

Нетфликс

 

ИИ, препоръчай ми филм!

Преди десетилетие особено нашумяла беше наградата на „Нетфликс“. Гигантът беше обещал милион долара на учените, които предлагат най-доброто решение в областта на алгоритмите за препоръчване на съдържание.

Последното връчване на приза през 2010-а беше отменено, от „Нетфликс“ се отказаха да организират повече надпреварата. Защото явно вече бяха станали достатъчно добри в това направление…

Дали системите за препоръчване са нещо добро или лошо, никак не е правилният въпрос. Винаги сме търсили препоръки от приятелите си за следващите книги, филми, плочи, на които да се насладим. Със сигурност е доста добър подход да се посъветваме с хора, които имат сходен вкус с нашия. Очевидно това например, че е един филм е станал много популярен, не е достатъчна гаранция, че ще ни хареса. Много по-добра идея е да сравним вкусовете си с наши приятели, които вече са го гледали.

Днес обаче нямаме време и за това. А и защо трябва да се случва по този начин, след като имаме на своя страна усъвършенстваните алгоритми за машинно самообучение? Те много добре умеят да съпоставят данните и да намират шаблоните, сходствата. В огромната база данни да открият хората със сходни с нашите вкусове, да систематизират информацията и на базата на това да ни дадат конкретна препоръка, която има много сериозен шанс да се окаже успешна.

И така, как работят системите за препоръчване, които днес са се доказали като най-добри?

 

Разделяй и уцелвай

Какво е машинното самообучение? Начин да създаваме „изкуствен интелект“, който помага в безброй много области (и може би един ден дори ще ни управлява). Както всички останали научни дисциплини, ако подходим без предубеждения, може да си го представим и като нещо по-просто. Компютърът получава огромна база от информация. После специалистите по машинно самообучение имат грижата да му предложат най-точните алгоритми, за да се опита да намери закономерностите в нея. Безброй са различните решения, някои са по-прости и могат да бъдат обяснени в няколко реда, други са почти невъзможни за популярно представяне.

Инженерите разделят данните, които подават, на такива за същинското обучение и за тестване на успеваемостта. После оставят програмата сама да опитва да налучква променливите параметри за съответния алгоритъм с основните данни и ги съпоставят с тестовите данни, отделени за тази цел.

В този момент прилагат различни нови методи, които да покажат колко добре се е справил със задачата си основният. Ако оценката му е достатъчно висока, са сигурни, че са си свършили работата. И могат да го пуснат на свобода…

 

Препоръчващи алгоритми

Снимка: mohamed Hassan, Pixabay

 

Четящи мозъци

Както стана дума, алгоритмите за препоръчване са едни от най-старите първопроходци в машинното самообучение, днес ги познаваме доста добре.

Основните подходи в това направление са два, наричат се „колаборативно филтриране“ и „филтриране, базирано на съдържанието“. В по-модерните решения се прилагат различни комбинации от тях така, че да се използват силните страни на двата подхода.

Колаборация, или сътрудничество, ще рече, че хората работят заедно, за да постигнат даден резултат. Това стои в основата и на колаборативното филтриране. Същият принцип, който споменахме и продължаваме да използваме и днес. А на езика на продажбите: „Хората, които купиха…, купиха и…“. Целта на алгоритъма в този случай е да обработи данните така, че максимално да потърси общите черти в избора на различните потребители, така че да изведе тенденциите.

Е, едно време всички харесваха „Титаник“, как тогава да се справим в океана от решения?

 

Колаборативно филтриране

Схема на колаборативно филтриране, направена от Google Developers

 

БезприСтрасти

Като цяло подходът е следният. Алгоритъмът за колаборативно филтриране групира хората, които са давали максимално близки рейтинги, както потребителя, на когото ще препоръчваме. После данните се използват, за да се изчисли колко е вероятно хората със сходен вкус да харесат и друг продукт от същата група. Измежду потребителите, харесали любимите ви филми, да намерим средните показатели за филмите и да видим за кои от тях са най-високи. Именно тях ще препоръчаме. Като, разбира се, опитаме да игнорираме например филмите, които имат твърде малко оценки, потребителите, които дават твърде разнопосочни числа. Или, т.нар. „пристрастие“, което в света на технологиите наричат с английския термин “bias”.

От другата страна идва филтрирането, базирано на съдържание. Идеята не е много различна, просто перспективата се обръща наобратно. Алгоритмите се базират на другите единици, които в случая са филмите, а не зрителите им. Сравняват се оценките на потребителите за всяка двойка филми и на базата на това се извежда предположение какъв би бил рейтингът на този потребител, който още не е гледал втория филм.

Както стана дума, „Нетфликс“ определено е пионер и доказан фактор в тази област, ето защо ще разгледаме по-подробно техния подход. Както твърдят от компанията, 80% от гледанията на техни филми са в резултат на персонализираните предложения. Представете си само! Едва 1 от 5 от филма е гледан, защото посетителят го е отворил сам, всички останали са били предложени като следващи най-добри решения.

 

Филтриране, базирано на съдържание

Схема на филтриране, базирано на съдържание, направена от Google Developers

 

Колаборационисти

„Нетфликс“ базират системата си повече върху подхода с колаборативното филтриране. Очевидно това се оказа печелившото решение след състезанието, за което ви споменах. А историята на наградата е повече от интересна. Малцина знаят, но „Нетфликс“ стартират бизнеса си в края на 90-те, разпространявайки филми на базата на абонамент, като доставят избраните заглавия на дивидита в домовете на зрителите.

През 2000 г. те представят за първи път напредничавата си система за препоръчване, а 6 години по-късно създават наградата, за която стана дума. Обещават да дадат 1 милион долара на всеки, който успее да създаде система с по-добри показатели. Има, разбира се и конкретна оценка, 1 милион не се дават току-тъй. Избран е един от най-често използваните критерии – този за оценка на средната квадратична грешка (RMSE). Алгоритъмът на „Нетфликс“ постига изключително високата стойност от 0,9525, а призът е обещан на всеки, който я надмине с поне 10%.

За щастие, наградата не си остава за тези, които са я обявили („за щастие“, защото те и без това си имат доста пари). През 2007 г. тя е спечелена с кандидатура, която ползва комбинация от два по-сложни алгоритми – матрична факторизация (SVD) и ограничени машини на Боцман (RBM). Успехът в този случай е вече 0,88, което изпълнява изискванията!

 

По първа програма

През 2009 г. наградата отново е спечелена, с нова комбинация от алгоритми. „Нетфликс“ чинно си изплащат отново обещаната сума, но този път решават да не използват предложените решения в своята практика. Преценяват, че за много малко по-добри резултати трябва да отделят прекалено сериозни разходи. Системата им и без това е доказано, че работи изключително добре, стигайки до споменатите 80% на препоръчаното съдържание.

Една от причините наградите след това да отпаднат е, че идва ерата на „стриймването“. Компанията спира да продава просто филми, а се превръща в абонаментна платформа, стигайки през 2021-а до над 190 милиона абонати!

Просто в този момент вече не им е чак такъв приоритет да препоръчват добре, защото следващата им продажба не е на нов филм, а на абонамент.

 

Препоръчващи алгоритми

Снимка: Gerd Altmann, Pixabay

 

Става за четене

Така системите за препоръчване продължават нататък, за да стигнем днес до времената на прословутия балон на филтрите. Със сигурност и днес именно споменатите алгоритми са в основата на персонализираното съдържание и препоръките, които получаваме от социалните мрежи и търсачките. Просто вече не се говори чак толкова за тези решения, защото те не са само повод за гордост.

Разбира се, всичко изброено дотук, са само основите идеи. Алгоритмите за препоръчване, с които работят „Фейсбук“ и „Гугъл“, са изключително комплексни и многопластови и, разбира се, за тях се знае малко. Освен това, последните разкрития, направени от бивш високопоставен служител на първата социална мрежа, ясно показват защо за компанията никак не е изгодно да показва системите си.

Що се отнася до „Гугъл“ и рекламите, които ви показва, има една малка подробност. На базата на ежедневните ви интеракции в мрежата, търсачката определя основни показатели за вас. Ще се учудите (или пък не) колко са точни те, ако надникнете тук. Даже можете да ги ограничите, поне така твърдят.

Така или иначе, в по-сложните задачи, като например лицевото разпознаване, машинния превод, автономните автомобили, днес се прилагат следващото поколение технологии. Те са висшият пилотаж в тази област и универсалното решение, на което се крепят най-големите очаквания за технологичното бъдеще – невронните мрежи.

Именно дълбоките невронни мрежи днес стоят в основата на препоръчващите системи на големите състезатели. При тях не се използват просто един или два конкретни алгоритъма, които обработват данните, а многобройни нива, способни да търсят още и още фини тенденции в данните. Благодарение на невронните мрежи компютрите дори могат да… сънуват! Но това е дълга и интересна тема, която скоро ще обсъдим по-подробно.

 

Препоръчващи алгоритми

Снимка: Gerd Altmann, Pixabay

 

Алгоритми на крак

Тук ще намерите файлово хранилище (малко странно, така е на български „репозитори“) с елементарен модел за създаването на алгоритъм за препоръчване на базата на официалната база данни, използвана за наградите на „Нетфликс“. Приложени са принципите на колаборативното филтриране.

И така, вече знаем малко повече за интелигентните системи, които ни подбират предпочитания – за новини, филми или книги. А това да знаем как работят, със сигурност е полезно и за да имаме предвид и негативните страни от тях. Алгоритмите не са добри или лоши. От нас зависи до каква степен ще им позволим с помощта на препоръчването да ни изпратят в „балона“. Те вече ни познават доста добре. Затова е добре и ние да ги опознаем…

Дигитални истории

Дигитални истории е и ще си остане изцяло некомерсиално начинание, на което посвещавам доста време и усилия. За създаването на сайта обаче са нужни определени разходи. Ако имате възможност и желание да подпомогнете сайта, вече можете да го направите. Разбира се, все така важна подкрепа си остава всяка добра дума, всяко споделяне на темите.

<a href="https://karamanev.me/author/georgik" target="_self">Георги Караманев</a>

Георги Караманев

Програмист, журналист и писател. Още за мен – тук.
Дигитални истории

Най-нови публикации:

Ювал Харари. Пророкът на новото време

Ювал Харари. Пророкът на новото време

Да разкажеш цялата история на човечеството в няколкостотин страници… звучи като невъзможна задача. После да разкажеш бъдещето. И накрая – да успееш да привлечеш вниманието към големите въпроси на...

повече информация
„Свободният човек не би смятал телефона си за нещо изключително“

„Свободният човек не би смятал телефона си за нещо изключително“

Днешният гост няма нужда от представяне, дори първото му име е достатъчно, за да привлече внимание. Китодар Тодоров е популярен артист, телевизионен водещ. Но също и герой от мемове, опитен геймър,...

повече информация
Останете любопитни!

Останете любопитни!

Кой е родният град на Яворов? Свищов. Изхалюцинирал го е изкуственият интелект, доста некадърно, ще предположите. Само че не беше той, казах го аз, участвайки в телевизионно предаване в праймтайма...

повече информация

Още публикации по темата:

От рубриката:

Останете любопитни!

Останете любопитни!

Кой е родният град на Яворов? Свищов.
Изхалюцинирал го е изкуственият интелект, доста некадърно, ще предположите. Само че не беше той, казах го аз, участвайки в телевизионно предаване в праймтайма на най-старата българска телевизия. Бих предположил, че е по-вероятно да не позная собственото си име, а не родното място на един от хората, чиято история ме вълнува цял живот. Обаче го сбърках и скоро няма да ходя в Чирпан.
Знанието не е даденост. Любопитството не идва само, а иска усилие.
Има ли обаче смисъл да помним къде е роден Яворов във времената, когато можем да го проверим за части от секундата?
Щеше ли да пише различни стихове, ако беше от Свищов?
Ще знаят ли следващите поколения къде е роден, как е писал? От какво се е вълнувал, къде и как е срещнал любовта?
Ако решите, питайте ChatGPT. Или Конституционния съд.
А моят личен отговор гласи: днес е по-важно отвсякога да останем любопитни!

повече информация
Васил Анастасов. VR среща взаимоучителната метода

Васил Анастасов. VR среща взаимоучителната метода

Той е на 21, а вече е помогнал на повече от 200 деца да направят първите си стъпки в професионално поприще, което може да се превърне в успешна кариера.
Днес Васил Анастасов се е заел с още една кауза. С помощта на модерните технологии да направи българските музеи по-атрактивни, привлекателни за младите. В началото сам извървява пътя към магията не миналото, за да разбере смисъла и важността на експонатите, които иначе се крият зад неразбираеми витрини с неатрактивни табели.
Хайде, нека потърсим заедно съкровище! Да опитаме да намерим важните пътеки сред обраслата поляна. За това как да превърнем музеите в магнетични места за младите. Къде се крият любопитството и желанието да споделяш знание, да помагаш. За историите на фона на най-модерните технологии в разработването на компютърни игри и системи с добавена и виртуална реалност. Запретвайте ръкави, чака ни приключение!

повече информация
Как срещаме децата с технологиите? (резултати от анкетата)

Как срещаме децата с технологиите? (резултати от анкетата)

По колко часа на ден децата имат досег с екран? Трябва ли в училище да има телефони? Как изглежда технологичното бъдеще за днешните деца? Какво има смисъл да учат? С какво е различно днешното родителство?
Тези и още много важни въпроси отправих в началото на февруари към родителите и близките на деца до 11 години. Анкетата на Дигитални истории събра повече от 350 мнения. Изводите са показателни, замислящи. Посланията, събрани там, си струва да бъдат четени и обсъждани.
Благодаря от сърце на всеки, който я попълни, на всеки, който помогна повече хора да се включат! Ето какви се оказаха резултатите.

повече информация

Най-новите:

Тест: Кой го нарисува – дете или ИИ?

Тест: Кой го нарисува – дете или ИИ?

Време е за неочакван, но важен тест. За експеримент, който поставя важни въпроси за бъдещето на творчеството, на човешкото, на образованието.
Предизвикайте себе си и своята интуиция! 15 картини, нарисувани от деца между 3 и 10 г., и 15 – генерирани от изкуствения интелект. Ако успеете да ги различите, очакват ви награди!
Отговорите се събират до 1 юли, анкетата не би ви отнела повече от 10 минути. За всяко от 30-те изображения е достатъчно да предположите дали е нарисувано от дете, или генерирано от ИИ, а също и да оцените техниката и въображението, вложени в първите 10. Можете да отговорите и само на част от въпросите. Анкетата е отворена и за деца!

повече информация
Ювал Харари. Пророкът на новото време

Ювал Харари. Пророкът на новото време

Ювал Ноа Харари. Често ще чуете името на историка и футуролог в разговорите за бъдещето. През последните години той се утвърди като световният мислител, който не само успява задълбочено и компетентно да разплита нишките, от които е съшита историята на човечеството, но и поставя големите въпроси на утрешния ден.
Но как един професор по история се превърна в любим автор на хора като Бил Гейтс и Барак Обама, Марк Зукърбърг и Бил Клинтън, докато в същото време е популярен, превеждан, четен и обсъждан? Как успява да стигне с дългите си тестове до съзнанието на хората във времената, когато концентрацията и задълбоченият поглед се превърнаха в екзотични умения?
Шарен образ, отвъд стереотипите. Любима мишена на всеки, който иска да блесне. Веган и защитник на животните, със съпруга му са начело на фондация, която цели да провокира обществения дебат по важни теми. Израелецът е едновременно широко признат учен и авторитет. Най-важното според мен – ценен и силен глас, който ни предупреждава за непосредствените опасности пред нас като вид. Ето какво си струва да знаем за него и впечатляващите му прозрения.

повече информация
„Свободният човек не би смятал телефона си за нещо изключително“

„Свободният човек не би смятал телефона си за нещо изключително“

Днешният гост няма нужда от представяне, дори първото му име е достатъчно, за да привлече внимание.
Китодар Тодоров е популярен артист, телевизионен водещ. Но също и герой от мемове, опитен геймър, който кани гости, за да играят онлайн, докато си говорят за живота…
Дали ще се получи забавен разговор? Или по-скоро ще ни даде поводи да се замислим…? За днешното ни място в света на технологиите, за компютърните игри като начин на живот. За трудния баланс и големите въпроси.
А как ли се раждат мемовете с Китодар, които забавляват всички ни и стават толкова популярни онлайн?
„Цялата ни съвременна цивилизация е построена на някакви машинки, от които сме зависими, и това е много тъпо. Един истински свободен човек не би трябвало да смята телефона за нещо изключително важно, нито компютъра. Това го губим с времето, защото усещането е, че ни дават всичко. Че технологиите ни дават свобода, а не е така. Напротив, те ни създават повече зависимости.“
Очаква ни неочакван разговор!

повече информация
Останете любопитни!

Останете любопитни!

Кой е родният град на Яворов? Свищов.
Изхалюцинирал го е изкуственият интелект, доста некадърно, ще предположите. Само че не беше той, казах го аз, участвайки в телевизионно предаване в праймтайма на най-старата българска телевизия. Бих предположил, че е по-вероятно да не позная собственото си име, а не родното място на един от хората, чиято история ме вълнува цял живот. Обаче го сбърках и скоро няма да ходя в Чирпан.
Знанието не е даденост. Любопитството не идва само, а иска усилие.
Има ли обаче смисъл да помним къде е роден Яворов във времената, когато можем да го проверим за части от секундата?
Щеше ли да пише различни стихове, ако беше от Свищов?
Ще знаят ли следващите поколения къде е роден, как е писал? От какво се е вълнувал, къде и как е срещнал любовта?
Ако решите, питайте ChatGPT. Или Конституционния съд.
А моят личен отговор гласи: днес е по-важно отвсякога да останем любопитни!

повече информация
Дженсън Хуанг. Магьосникът на NVIDIA

Дженсън Хуанг. Магьосникът на NVIDIA

Той е една от големите звезди на днешния ден. С 30-годишна упоритост гради компанията, която се превърна в най-скъпо оценената за всички времена. Когато дойде време да представи поредния иновативен чип, той се превръща в маркетингова икона.
Дженсън Хуанг грабва коженото яке, излиза пред уютната за него светлина на прожекторите и шоуто започва.
Мъдростта на изтока среща лустрото на запада. Един от най-богатите американци, единствен в списъка, който е роден в Китай (…в известен смисъл). Историята му идва, за да покаже, че и днес силните личности имат значение. Струва си да извървим заедно прелюбопитния му път, а и да чуем вижданията му за бъдещето, в което всички ние ще живеем.

повече информация
Иван Попов, който улови бъдещето

Иван Попов, който улови бъдещето

„Мирогледът на човек зависи съществено от неговия информационен метаболизъм.“
„Човек за човека е бот. А бот за бота е човек. Но що за човек е ботът? И що за бот е човекът?“
Иван Попов е майстор на силогизмите и не само. Той е писател, оставил ни малко на брой произведения от началото на новото хилядолетие. Макар приживе да има само един издаден роман, при това в малък тираж, той си остава митично име.
Защото по неповторим начин представя бъдещето. Улавя тенденциите, събира искриците познание, които рисуват пъстрата картина на технологичния утрешен ден. Успява да срещне науката и литературата, които рамо до рамо да търсят човешкото и надчовешкото, да улавят тенденции.
Посланията на Иван Попов са силни, вълнуващи, замислящи днес, повече от всякога. Благодаря от сърце на Николай Генов, който привлече вниманието ми към този забележителен писател, прогностик, журналист, учен. Според мен е важно думите и името му да стигнат до повече хора. Ще се радвам на всякаква подкрепа – разкази на хора, които са го познавали, помощ за популяризиране на творчеството му или просто добри идеи. Пишете ми!

повече информация
Share This